# 此文件用于读取data.csv文件并保存为npy文件, 并进行所有数字出现频次的展示
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 读取 csv 文件
df = pd.read_csv('data.csv', header=None)

# 将数据转换为 numpy 数组
data = np.array(df)

# 使用eye()函数将数字转换为独热编码
one_hot = np.eye(34)[data]

np.save('npys/data.npy', one_hot)

# 统计各个数字的出现频次, 展示为直方图显示
times = data.flatten()
hist, bins = np.histogram(times, bins=range(1, 35))
plt.hist(times, bins=bins)
plt.xlabel('Number')
plt.ylabel('Times')
plt.show()